#razonamiento espacial

Planificación espacial visual con autodestilación de brecha de modalidad

MGSD mejora la planificación espacial visual un 19% mediante autodestilación consciente de brecha de modalidad, cerrando la brecha percepción-razonamiento.

2026-06-06 · 2 min

LongSpace: Memoria espacial de largo plazo – percepción y recuerdo en video

Descubre LongSpace, un framework de memoria espacial para videos largos que mejora la comprensión de rutas y objetos. Ideal para IA en robótica y conducción.

2026-06-06 · 2 min

GeoVR: Aprendizaje de representaciones geométricas para MLLM espaciales

Descubre GeoVR, un nuevo enfoque que enseña a los modelos multimodales a comprender el espacio 3D usando solo videos 2D. Resultados estatales del arte en razonamiento espacial.

2026-06-06 · 1 min

De lo simbólico a lo geométrico: razonamiento espacial en LLMs

Descubre cómo el nuevo SLM integra representaciones geométricas para lograr razonamiento espacial real en LLMs, superando métodos simbólicos tradicionales.

2026-06-04 · 2 min

Tokens de Percepción Imaginativa Mejoran Razonamiento Espacial

Los Tokens de Percepción Imaginativa (IPT) mejoran el razonamiento espacial en modelos multimodales sin generar imágenes. Aumento del 3.4% en precisión en conteo multivista.

2026-06-03 · 1 min

Respuesta a preguntas 3D Zero-Shot mediante transporte jerárquico de vista a token

Descubre cómo KeyVT optimiza la selección de vistas y tokens para responder preguntas sobre escenas 3D sin entrenamiento, superando a métodos existentes.

2026-06-03 · 3 min

Cuándo y cuánto imaginar: Escalado adaptativo con modelos del mundo para razonamiento espacial

Descubre cuándo y cuánto imaginar en razonamiento espacial visual. AVIC optimiza el uso de modelos del mundo, superando a GPT-4o con menos recursos.

2026-06-02 · 1 min

Límites del razonamiento espacial en LLMs de frontera

Los LLM de frontera fallan en rotación mental incluso con ayuda externa. Estudio: solo 62.5% de precisión. Descubre por qué carecen de primitivas visuales.

2026-06-02 · 2 min

Mapa jerárquico semántico-geométrico para navegación visual-lingüística

Descubre cómo un mapa jerárquico semántico-geométrico permite navegar en 3D con instrucciones de lenguaje, superando métodos supervisados.

2026-06-02 · 3 min

Diversidad sobre frecuencia: repensar uso de herramientas en agentes visuales

La diversidad en exploración supera a la frecuencia de uso de herramientas. Descubre el colapso y cómo la regularización de entropía mejora el razonamiento.

2026-06-02 · 2 min

Destilando programas neuro-simbólicos en LLMs 3D multimodales

Descubre cómo APEIRIA combina la transparencia del razonamiento simbólico con la flexibilidad de los LLMs 3D para mejorar el razonamiento espacial. ¡Lee más!

2026-06-02 · 2 min

PlanarBench: Evaluando Razonamiento Espacial de LLMs con Grafos Planos

PlanarBench evalúa la capacidad de los LLMs para dibujar grafos planos en ASCII. Descubre cómo el número de aristas predice el rendimiento de 91 modelos.

2026-06-02 · 2 min

Ver no es saber: cuándo los VLMs deberían abstenerse

¿Los VLMs saben cuándo abstenerse? Un estudio revela que fallan en preguntas espaciales con oclusión o ambigüedad, respondiendo con exceso de confianza. Descubre por qué.

2026-06-01 · 2 min